Colegio Universitario de Cartago

Profesor: Osvaldo Gonzalez Chaves

Javier Brenes Redondo

Diego Montero Vargas

Primer Cuatrimestre, 2025


Contenido

Introducción

Este proyecto se centra en la aplicación de las técnicas aprendidas en este curso para analizar el conjunto de datos “ARCHIVO_VIOLENCIA_DOMESTICA.tsv”. Utilizando bibliotecas de R, el objetivo principal es extraer información relevante y responder a las preguntas de investigación planteadas, además de generar estadísticas descriptivas que permitan comprender mejor los datos.

Conjunto de datos

El archivo seleccionado, “ARCHIVO_VIOLENCIA_DOMESTICA.tsv”, contiene registros de denuncias por violencia doméstica a nivel nacional desde 2015 hasta 2025, obtenidos del portal del Organismo de Investigación Judicial. A continuación, se explican las variables presentes en este conjunto de datos.

Variable Tipo Descripcion
Anno int Año de la estadística
Mes int Mes de la estadística
NombreMes texto Descripción del mes
NombreMateria texto Nombre de la materia
NombreCircuito texto Nombre del circuito
NombreDespacho texto Descripción del despacho
NombreTipoDespacho texto Descripción del tipo de despacho
CirculanteInicial int Cantidad de expedientes activos al iniciar el mes
CirculanteInicialLeg int Subconjunto del apartado anterior, en donde el tipos de caso es “Legajo”, válido para despachos laborales y contenciosos.
Entrados int Cantidad de expedientes entrados como nuevos durante el mes.
TestimoniosPiezas int Subconjunto de los entrados, en donde el expediente sea un testimonio de piezas.
Legajos int Subconjunto de los entrados, en donde el expediente sea un “legajo”.
Reentrados int Cantidad de expedientes reentrados durante el mes.
TerminadosXImcompetencia int Subconjunto de los terminados, en donde el motivo de término sea “Por Incompetencia”
AbandonadosOInactivos int Subconjunto de los terminados, en donde el motivo de término sea “Abandonado ó Inactivo”
Terminasdos int Cantidad de expedientes finalizados durante el mes.
CirculanteFinal int Cantidad de expedientes activos al finalizar el mes.
CirculanteFinalLegajos int Subconjunto del apartado anterior, en donde el tipos de caso es “Legajo”, válido para despachos laborales y contenciosos.

Estadísticas Básicas

Para aquellos valores numéricos del dataset se encuentran las siguientes estadísticas

variable Media Mediana Moda
CirculanteInicial 587.7595905 386 84
CirculanteInicialLeg 0.0000000 0 0
Entrados 61.6674479 40 9
TestimoniosPiezas 13.0511903 3 0
Legajos 0.0000000 0 0
Reentrados 0.5901073 0 0
TerminadosXImcompetencia 8.2380659 1 0
AbandonadosOInactivos 0.0000000 0 0
Terminasdos 67.5211546 38 0
CirculanteFinal 587.1793512 386 43
CirculanteFinalLegajos 0.0000000 0 0

Correlaciones

Para analizar las relaciones entre las variables numéricas del conjunto de datos, se presenta la siguiente matriz de correlaciones:

Matriz de Correlación
CirculanteInicial Entrados TestimoniosPiezas Reentrados TerminadosXImcompetencia Terminasdos CirculanteFinal
CirculanteInicial 1.00 0.80 0.48 0.18 -0.08 0.80 1.00
Entrados 0.80 1.00 0.72 0.15 0.44 0.72 0.80
TestimoniosPiezas 0.48 0.72 1.00 0.11 0.56 0.53 0.48
Reentrados 0.18 0.15 0.11 1.00 0.01 0.19 0.17
TerminadosXImcompetencia -0.08 0.44 0.56 0.01 1.00 -0.03 -0.08
Terminasdos 0.80 0.72 0.53 0.19 -0.03 1.00 0.76
CirculanteFinal 1.00 0.80 0.48 0.17 -0.08 0.76 1.00

Interpretación de las correlaciones:

  • Los valores cercanos a 1 (naranja oscuro) indican una correlación positiva fuerte
  • Los valores cercanos a -1 (azul oscuro) indican una correlación negativa fuerte
  • Los valores cercanos a 0 (blanco) indican poca o ninguna correlación
  • El tamaño y color de los círculos representan la fuerza y dirección de la correlación

Como se observa en el gráfico en su mayoría las variables tienen relación entre ellas de una forma positiva, tienen a crecer juntas.

Nota: Para el cálculo de las correlaciones, se eliminaron las columnas CirculanteInicialLeg, Legajos, AbandonadosOInactivos y CirculanteFinalLegajos del conjunto de datos. Estas columnas contenían únicamente el valor 0, lo que significa que no presentaban ninguna variación. Como la variación es fundamental para calcular la correlación (se utiliza en una división), una columna sin variación causaría un error matemático (división por cero). Por esta razón, se optó por remover estas columnas para evitar problemas en el análisis.

Valores atípicos

Para visualizar la distribución y detectar valores atípicos en las variables numéricas, se presentan los siguientes diagramas de caja:

Los diagramas de caja nos permiten observar: - La distribución de los datos para cada variable - La presencia de valores atípicos (puntos rojos) - La mediana y los cuartiles de cada variable

Hipotesis

Hipótesis 1

Planteamiento

Distribución Geográfica de la Violencia Doméstica:

Pregunta de Investigación:

¿Existe una variación significativa en la incidencia de casos de violencia doméstica entre áreas internas del país (San Jose, Heredia, Alajuela, Cartago) y áreas externas del país (Puntarenas, Limon, Guanacaste)?

Objetivos:

Analizar la distribución geográfica de los casos nuevos y terminados de violencia doméstica por circuito judicial. Realizar una comparación de la incidencia de casos entre áreas internas del país y áreas externas.

Requerimientos de Datos:

Depuración y homogeneización del conjunto de datos existente. Enriquecimiento del conjunto de datos para permitir la clasificación de los circuitos judiciales por provincia.

Análisis

Nuestro dataset no incluye una columna de provincia, es por eso que tuvimos que enriquecer el dataset a través de analizar NombreCircuito y apartir de este determinar la provincia en la que se encontraba así como clasificar si dicha provincia se encuentra en el interior del país o en el exterior:

Anno Mes NombreCircuito Entrados Terminasdos Provincia InteriorPais
2015 1 CIRCUITO JUDICIAL DE GOLFITO 99 82 Puntarenas NO
2015 1 CIRCUITO JUDICIAL DE ATENAS 27 12 Alajuela SI
2015 1 II CIRCUITO JUDICIAL DE GUANACASTE (NICOYA) 90 76 Guanacaste NO
2015 1 I CIRCUITO JUDICIAL DE LA ZONA SUR (PEREZ ZELEDON) 123 99 San Jose SI
2015 1 II CIRCUITO JUDICIAL DE ALAJUELA (SAN CARLOS) 92 185 Alajuela SI
2015 1 II CIRCUITO DE LA ZONA ATLÁNTICA (POCOCÍ-SIQUIRRES) 126 146 Limon NO
2015 1 I CIRCUITO JUDICIAL DE GUANACASTE (LIBERIA) 88 84 Guanacaste NO
2015 1 CIRCUITO JUDICIAL DE TURRIALBA 69 160 Cartago SI
2015 1 CIRCUITO JUDICIAL DE GOLFITO (PUERTO JIMENEZ) 28 29 Puntarenas NO
2015 1 CIRCUITO JUDICIAL DE HEREDIA (SARAPIQUÍ) 50 111 Heredia SI

Nota: Primeros 10 registros del dataset con las nuevas columnas.


Iniciemos haciendo un conteo por provincia

Luego un conteo por zona

Si nos basaramos en un conteo de registros, es claro que en el interior del país hay mas casos de violencia domestica, pero esto no seria una interpretacion valida, ya que en el interior del país estamos contando mas provincias que en el exterior del país, ademas cabe la posibilidad que en el interior hayan mas circuitos por lo que es normal que hayan mas registros en dataset.

Para poder responder la pregunta que se planteo necesitamos analizar la variable Entrados y su distribución por zona.

Como se aprecia en el gráfico anterior, en el exterior del país (Guanacaste, Puntarenas, Limón) es donde mas casos entrados de violencia domestica hay en una mayor frecuencia pero en rangos menores, en comparacion
al interior del país donde la cantidad de casos entrados en rangos mayores entre 160 y 500 predomina.

Veamos un histograma para ver si existe un crecimiento a lo largo de los años.

Si vemos los datos desde un punto de vista historico, se aprecia que internamente es donde mas casos de violencia domestica existen, tambien que año a año los valores incrementan.

Pero si hacemos una suma de todos los casos entrantes a lo largo de los años, agrupado por zona, que obtenemos ?

Es posible conocer la totalidad de casos por Provincia entonces ?

Conclusión

Podemos definir que la mayoría de los casos de violencia domestica se presentan en el interior del país, donde luego de nuestro análisis San Jose es la provincia con mas casos registrados.

Aunque los datos muestran que en el exterior del país hay en frecuencia mas denuncias, se ve opacado por la cantidad de casos en rangos altos que se da en el interior del país.

Hipótesis 2

Planteamiento

Temporalidad de la Violencia Doméstica:

Pregunta de Investigación:

¿Se identifican periodos específicos del año con un aumento significativo en la presentación de casos de violencia doméstica?

Objetivos:

Determinar los periodos del año (meses) con mayor incidencia de casos nuevos de violencia doméstica. Analizar la evolución de los casos nuevos a lo largo de los años.

Requerimientos de Datos:

Definición de un subconjunto de datos a partir del existente, ordenado cronológicamente por mes y año de ingreso de los casos.

Análisis

Este gráfico muestra un conteo mensual desde el año 2015 al 2025 con el total de nuevos casos de violencia Es importante destacar que los datos proporcionados del 2025 llegan solamente del mes de Enero


En este gráfico podemos ver el promedio mensual de nuevos casos por cada año. Encontramos que el 2015 y 2016 sobresalen del promedio de los otros años


En este gráfico se contabilizan todos los casos nuevos de cada año Se encuentra que desde el 2015 hasta 2019 hay una tendencia a la alza de casos y luego cae levemente


Este gráfico muestra el total de casos nuevos separados por mes

Conclusión

Se confirma que en los últimos 10 años el mes con mas casos de denuncias por violencia doméstica es el mes de Enero en primer lugar, seguido de Mayo y Agosto y los demás meses se mantienen muy similares entre ellos. Mientras que los dos mas bajos son Diciembre y Febrero.

Hipótesis 3

Planteamiento

Eficiencia en la Resolución de Casos

Pregunta de Investigación:

¿Cuál es la eficiencia de los diferentes circuitos judiciales en la resolución de casos de violencia doméstica en el 2024?

Objetivos:

Evaluar la eficiencia de los despachos judiciales en el cierre de casos de violencia doméstica. Identificar los circuitos judiciales con mayor y menor eficiencia en la resolución de casos.

Requerimientos de Datos:

Utilización del conjunto de datos existente para analizar la relación entre los casos ingresados y los casos terminados por circuito judicial.

Análisis

Como nos lo hemos planteado queremos analizar unicamente el año 2024 es por eso que iniciamos filtrando estos datos para obtener solo lo requerido.

Anno Mes NombreMes NombreMateria NombreCircuito NombreDespacho NombreTipoDespacho CirculanteInicial CirculanteInicialLeg Entrados TestimoniosPiezas Legajos Reentrados TerminadosXImcompetencia AbandonadosOInactivos Terminasdos CirculanteFinal CirculanteFinalLegajos
2024 1 Enero VIOLENCIA DOMÉSTICA II Circuito Judicial de Alajuela JUZGADO CONTRAVENCIONAL DE GUATUSO (VIOLENCIA DOMÉSTICA) Juzgado 244 0 30 0 0 0 0 0 13 261 0
2024 1 Enero VIOLENCIA DOMÉSTICA II Circuito Judicial de Alajuela JUZGADO CONTRAVENCIONAL DE LA FORTUNA (VIOLENCIA DOMÉSTICA) Juzgado 455 0 68 23 0 0 23 0 81 442 0
2024 1 Enero VIOLENCIA DOMÉSTICA Circuito Judicial de Heredia JUZGADO CONTRA LA VIOLENCIA DOMÉSTICA DE HEREDIA Juzgado 1046 0 119 48 0 1 4 0 164 1046 0
2024 1 Enero VIOLENCIA DOMÉSTICA II Circuito Judicial de Alajuela JUZGADO CONTRA LA VIOLENCIA DOMÉSTICA DEL II CIRCUITO JUDICIAL DE ALAJUELA Juzgado 1315 0 115 58 0 0 11 0 168 1309 0
2024 1 Enero VIOLENCIA DOMÉSTICA I CIRCUITO DE LA ZONA ATLÁNTICA (BRIBRÍ) JUZGADO CONTRAVENCIONAL DE BRIBRÍ (VIOLENCIA DOMÉSTICA) JUZGADO DE VIOLENCIA DOMÉSTICA 798 0 58 4 0 0 0 0 126 734 0

Nota: la tabla anterior solo muestra los 5 primeros registros.

Para poder determinar la eficiencia de cada circuito hemos definido las siguientes formulas a partir de la siguientes variables:

  1. CirculanteInicial
  2. Entrados
  3. Terminasdos
  4. TerminadosXImcompetencia
Primer Formula

Cuantos casos fueron resueltos comparados al total de trabajo (circulantes + entrados), donde un valor alto indica mejor eficiencia en manejo de caso.

Eficiencia_Carga_Total = (Total_Terminados / Carga_Total) * 100
Segunda Formula

Que tanto manejan la cantidad de casos, mejor porcentaje indica mejor forma de manejar casos pendientes

Tasa_Resolucion_Pendientes = (Total_Terminados / Total_Circulante_Inicial) * 100

Lo primero que haremos es sumarizar los datos

NombreCircuito Total_Circulante_Inicial Total_Entrados Total_Terminados Carga_Total Eficiencia_Carga_Total Tasa_Resolucion_Pendientes Circulante_Final Reduccion_Pendientes
II CIRCUITO JUDICIAL DE SAN JOSE (GOICOECHEA) 45363 8313 11365 53676 21.17 25.05 42311 6.7279501
I CIRCUITO JUDICIAL DE GUANACASTE (BAGACES) 455 54 97 509 19.06 21.32 412 9.4505495
CIRCUITO JUDICIAL DE PUNTARENAS (QUEPOS) 3197 421 651 3618 17.99 20.36 2967 7.1942446
CIRCUITO JUDICIAL DE PUNTARENAS (MONTEVERDE) 433 45 82 478 17.15 18.94 396 8.5450346
CIRCUITO JUDICIAL DE CARTAGO (JIMÉNEZ) 588 53 108 641 16.85 18.37 533 9.3537415
II CIRCUITO JUDICIAL DE ALAJUELA (UPALA) 2190 364 422 2554 16.52 19.27 2132 2.6484018
CIRCUITO JUDICIAL DE PUNTARENAS (ESPARZA) 2895 342 534 3237 16.50 18.45 2703 6.6321244
I CIRCUITO JUDICIAL DE SAN JOSÉ 13905 2081 2593 15986 16.22 18.65 13393 3.6821287
CIRCUITO JUDICIAL DE HEREDIA (SANTO DOMINGO) 3028 444 556 3472 16.01 18.36 2916 3.6988111
CIRCUITO JUDICIAL DE CARTAGO (TARRAZÚ, DOTA Y LEÓN CORTÉS) 1364 145 228 1509 15.11 16.72 1281 6.0850440
CIRCUITO JUDICIAL DE PUNTARENAS (PARRITA) 2269 279 372 2548 14.60 16.39 2176 4.0987219
II Circuito Judicial Zona Atlántica 15566 1603 2498 17169 14.55 16.05 14671 5.7497109
Circuito Judicial de Heredia 20703 2554 3378 23257 14.52 16.32 19879 3.9800995
I CIRCUITO JUDICIAL DE ALAJUELA (OROTINA) 3109 258 466 3367 13.84 14.99 2901 6.6902541
II CIRCUITO JUDICIAL DE GUANACASTE (NANDAYURE) 320 44 50 364 13.74 15.62 314 1.8750000
III CIRCUITO JUDICIAL DE SAN JOSÉ (MORA) 1365 155 205 1520 13.49 15.02 1315 3.6630037
CIRCUITO JUDICIAL DE HEREDIA (SAN RAFAEL) 3115 426 459 3541 12.96 14.74 3082 1.0593900
CIRCUITO JUDICIAL DE CARTAGO (TURRIALBA) 3463 266 474 3729 12.71 13.69 3255 6.0063529
III CIRCUITO JUDICIAL DE SAN JOSÉ (DESAMPARADOS) 21800 2067 3031 23867 12.70 13.90 20836 4.4220183
II CIRCUITO JUDICIAL DE GUANACASTE (JICARAL) 943 111 132 1054 12.52 14.00 922 2.2269353
III Circuito Judicial de Alajuela 15611 1703 2168 17314 12.52 13.89 15146 2.9786689
CIRCUITO JUDICIAL DE PUNTARENAS (GARABITO) 3017 343 412 3360 12.26 13.66 2948 2.2870401
I Circuito Judicial Zona Atlántica 6418 717 872 7135 12.22 13.59 6263 2.4150826
II CIRCUITO JUDICIAL DE ALAJUELA (LOS CHILES) 3265 429 450 3694 12.18 13.78 3244 0.6431853
CIRCUITO JUDICIAL DE HEREDIA (SAN ISIDRO) 882 130 123 1012 12.15 13.95 889 -0.7936508
III CIRCUITO JUDICIAL DE SAN JOSÉ (ESCAZÚ) 5143 531 688 5674 12.13 13.38 4986 3.0526930
II Circuito Judicial de Alajuela 28229 2837 3731 31066 12.01 13.22 27335 3.1669560
II CIRCUITO JUDICIAL DE GUANACASTE (NICOYA) 8801 950 1158 9751 11.88 13.16 8593 2.3633678
I Circuito Judicial Zona Sur 14951 1487 1927 16438 11.72 12.89 14511 2.9429470
III CIRCUITO JUDICIAL DE SAN JOSÉ (HATILLO, SAN SEBASTIÁN Y ALAJUELITA) 18344 1647 2336 19991 11.69 12.73 17655 3.7559965
III CIRCUITO JUDICIAL DE SAN JOSÉ (ACOSTA) 1676 129 209 1805 11.58 12.47 1596 4.7732697
II CIRCUITO JUDICIAL DE GUANACASTE (SANTA CRUZ) 4868 501 621 5369 11.57 12.76 4748 2.4650781
I Circuito Judicial de Guanacaste 16396 1674 2073 18070 11.47 12.64 15997 2.4335204
CIRCUITO JUDICIAL DE PUNTARENAS (MONTES DE ORO, MIRAMAR) 1191 121 150 1312 11.43 12.59 1162 2.4349286
I CIRCUITO JUDICIAL DE GUANACASTE (ABANGARES) 3115 327 389 3442 11.30 12.49 3053 1.9903692
Circuito Judicial de Puntarenas 12299 1254 1529 13553 11.28 12.43 12024 2.2359541
I Circuito Judicial de Alajuela 33974 3372 4198 37346 11.24 12.36 33148 2.4312710
I CIRCUITO JUDICIAL DE GUANACASTE (LIBERIA) 3789 385 467 4174 11.19 12.33 3707 2.1641594
I CIRCUITO JUDICIAL DE SAN JOSÉ (TURRUBARES) 1130 153 143 1283 11.15 12.65 1140 -0.8849558
II CIRCUITO JUDICIAL DE LA ZONA SUR (COTO BRUS) 3563 436 439 3999 10.98 12.32 3560 0.0841987
I CIRCUITO JUDICIAL DE ALAJUELA (SAN MATEO) 860 98 105 958 10.96 12.21 853 0.8139535
I Circuito Judicial de Limón 1268 118 151 1386 10.89 11.91 1235 2.6025237
II CIRCUITO JUDICIAL DE LA ZONA SUR (OSA) 5369 513 637 5882 10.83 11.86 5245 2.3095549
CIRCUITO JUDICIAL DE PUNTARENAS (CÓBANO) 1840 166 214 2006 10.67 11.63 1792 2.6086957
III CIRCUITO JUDICIAL DE SAN JOSÉ (SANTA ANA) 5074 523 595 5597 10.63 11.73 5002 1.4189988
I CIRCUITO JUDICIAL DE GUANACASTE (LA CRUZ) 776 77 90 853 10.55 11.60 763 1.6752577
I CIRCUITO JUDICIAL DE SAN JOSÉ (PURISCAL) 4789 506 557 5295 10.52 11.63 4738 1.0649405
II CIRCUITO DE LA ZONA ATLÁNTICA (SIQUIRRES) 6407 563 730 6970 10.47 11.39 6240 2.6065241
II CIRCUITO JUDICIAL DE GUANACASTE (CARRILLO) 8778 823 1005 9601 10.47 11.45 8596 2.0733652
I CIRCUITO JUDICIAL DE ALAJUELA (PÓAS) 3568 289 401 3857 10.40 11.24 3456 3.1390135
II CIRCUITO JUDICIAL DE GUANACASTE (HOJANCHA) 474 47 54 521 10.36 11.39 467 1.4767932
Circuito Judicial de Cartago 34174 3230 3868 37404 10.34 11.32 33536 1.8669164
II CIRCUITO JUDICIAL DE LA ZONA SUR (GOLFITO) 3946 381 446 4327 10.31 11.30 3881 1.6472377
CIRCUITO JUDICIAL DE CARTAGO (LA UNIÓN) 4005 382 450 4387 10.26 11.24 3937 1.6978777
I CIRCUITO DE LA ZONA ATLÁNTICA (BRIBRÍ) 7352 643 820 7995 10.26 11.15 7175 2.4075082
II CIRCUITO JUDICIAL DE LA ZONA SUR (GOLFITO) (PUERTO JIMÉNEZ) 1848 249 213 2097 10.16 11.53 1884 -1.9480519
CIRCUITO JUDICIAL DE CARTAGO (PARAÍSO) 2171 213 237 2384 9.94 10.92 2147 1.1054813
III CIRCUITO JUDICIAL DE ALAJUELA (SAN RAMON) 9095 996 1000 10091 9.91 11.00 9091 0.0439802
CIRCUITO JUDICIAL DE HEREDIA (SARAPIQUÍ) 7022 765 746 7787 9.58 10.62 7041 -0.2705782
I CIRCUITO JUDICIAL DE LA ZONA SUR (BUENOS AIRES) 5776 425 593 6201 9.56 10.27 5608 2.9085873
I CIRCUITO DE LIMÓN (BRIBRÍ) 1443 137 150 1580 9.49 10.40 1430 0.9009009
II CIRCUITO JUDICIAL DE LA ZONA SUR (CORREDORES) 7441 750 748 8191 9.13 10.05 7443 -0.0268781
CIRCUITO JUDICIAL DE CARTAGO (ALVARADO) 442 29 42 471 8.92 9.50 429 2.9411765
III CIRCUITO JUDICIAL DE SAN JOSÉ (PAVAS) 9426 835 901 10261 8.78 9.56 9360 0.7001910
II Circuito Judicial de Limón 3140 300 301 3440 8.75 9.59 3139 0.0318471
I CIRCUITO DE LA ZONA ATLÁNTICA (BATÁN-MATINA) 5891 487 537 6378 8.42 9.12 5841 0.8487523
I CIRCUITO JUDICIAL DE GUANACASTE (TILARAN) 470 45 42 515 8.16 8.94 473 -0.6382979
I CIRCUITO JUDICIAL DE GUANACASTE (CAÑAS) 868 77 72 945 7.62 8.29 873 -0.5760369
II Circuito Judicial de Guanacaste 8412 715 643 9127 7.05 7.64 8484 -0.8559201
III CIRCUITO JUDICIAL DE SAN JOSÉ (ASERRÍ) 12168 681 844 12849 6.57 6.94 12005 1.3395792
II CIRCUITO DE LIMÓN (SIQUIRRES) 1191 121 63 1312 4.80 5.29 1249 -4.8698573
I CIRCUITO DE LIMÓN (BATÁN-MATINA) 1143 99 51 1242 4.11 4.46 1191 -4.1994751

Una vez que tenemos los datos sumarizados queremos convertir las columnas en filas, esto para poder organizar los datos.

NombreCircuito Tipo_Eficiencia Porcentaje
II CIRCUITO JUDICIAL DE SAN JOSE (GOICOECHEA) Eficiencia_Carga_Total 21.17
II CIRCUITO JUDICIAL DE SAN JOSE (GOICOECHEA) Tasa_Resolucion_Pendientes 25.05
I CIRCUITO JUDICIAL DE GUANACASTE (BAGACES) Eficiencia_Carga_Total 19.06
I CIRCUITO JUDICIAL DE GUANACASTE (BAGACES) Tasa_Resolucion_Pendientes 21.32
CIRCUITO JUDICIAL DE PUNTARENAS (QUEPOS) Eficiencia_Carga_Total 17.99
CIRCUITO JUDICIAL DE PUNTARENAS (QUEPOS) Tasa_Resolucion_Pendientes 20.36
CIRCUITO JUDICIAL DE PUNTARENAS (MONTEVERDE) Eficiencia_Carga_Total 17.15
CIRCUITO JUDICIAL DE PUNTARENAS (MONTEVERDE) Tasa_Resolucion_Pendientes 18.94
CIRCUITO JUDICIAL DE CARTAGO (JIMÉNEZ) Eficiencia_Carga_Total 16.85
CIRCUITO JUDICIAL DE CARTAGO (JIMÉNEZ) Tasa_Resolucion_Pendientes 18.37
II CIRCUITO JUDICIAL DE ALAJUELA (UPALA) Eficiencia_Carga_Total 16.52
II CIRCUITO JUDICIAL DE ALAJUELA (UPALA) Tasa_Resolucion_Pendientes 19.27
CIRCUITO JUDICIAL DE PUNTARENAS (ESPARZA) Eficiencia_Carga_Total 16.50
CIRCUITO JUDICIAL DE PUNTARENAS (ESPARZA) Tasa_Resolucion_Pendientes 18.45
I CIRCUITO JUDICIAL DE SAN JOSÉ Eficiencia_Carga_Total 16.22
I CIRCUITO JUDICIAL DE SAN JOSÉ Tasa_Resolucion_Pendientes 18.65
CIRCUITO JUDICIAL DE HEREDIA (SANTO DOMINGO) Eficiencia_Carga_Total 16.01
CIRCUITO JUDICIAL DE HEREDIA (SANTO DOMINGO) Tasa_Resolucion_Pendientes 18.36
CIRCUITO JUDICIAL DE CARTAGO (TARRAZÚ, DOTA Y LEÓN CORTÉS) Eficiencia_Carga_Total 15.11
CIRCUITO JUDICIAL DE CARTAGO (TARRAZÚ, DOTA Y LEÓN CORTÉS) Tasa_Resolucion_Pendientes 16.72
CIRCUITO JUDICIAL DE PUNTARENAS (PARRITA) Eficiencia_Carga_Total 14.60
CIRCUITO JUDICIAL DE PUNTARENAS (PARRITA) Tasa_Resolucion_Pendientes 16.39
II Circuito Judicial Zona Atlántica Eficiencia_Carga_Total 14.55
II Circuito Judicial Zona Atlántica Tasa_Resolucion_Pendientes 16.05
Circuito Judicial de Heredia Eficiencia_Carga_Total 14.52
Circuito Judicial de Heredia Tasa_Resolucion_Pendientes 16.32
I CIRCUITO JUDICIAL DE ALAJUELA (OROTINA) Eficiencia_Carga_Total 13.84
I CIRCUITO JUDICIAL DE ALAJUELA (OROTINA) Tasa_Resolucion_Pendientes 14.99
II CIRCUITO JUDICIAL DE GUANACASTE (NANDAYURE) Eficiencia_Carga_Total 13.74
II CIRCUITO JUDICIAL DE GUANACASTE (NANDAYURE) Tasa_Resolucion_Pendientes 15.62
III CIRCUITO JUDICIAL DE SAN JOSÉ (MORA) Eficiencia_Carga_Total 13.49
III CIRCUITO JUDICIAL DE SAN JOSÉ (MORA) Tasa_Resolucion_Pendientes 15.02
CIRCUITO JUDICIAL DE HEREDIA (SAN RAFAEL) Eficiencia_Carga_Total 12.96
CIRCUITO JUDICIAL DE HEREDIA (SAN RAFAEL) Tasa_Resolucion_Pendientes 14.74
CIRCUITO JUDICIAL DE CARTAGO (TURRIALBA) Eficiencia_Carga_Total 12.71
CIRCUITO JUDICIAL DE CARTAGO (TURRIALBA) Tasa_Resolucion_Pendientes 13.69
III CIRCUITO JUDICIAL DE SAN JOSÉ (DESAMPARADOS) Eficiencia_Carga_Total 12.70
III CIRCUITO JUDICIAL DE SAN JOSÉ (DESAMPARADOS) Tasa_Resolucion_Pendientes 13.90
II CIRCUITO JUDICIAL DE GUANACASTE (JICARAL) Eficiencia_Carga_Total 12.52
II CIRCUITO JUDICIAL DE GUANACASTE (JICARAL) Tasa_Resolucion_Pendientes 14.00
III Circuito Judicial de Alajuela Eficiencia_Carga_Total 12.52
III Circuito Judicial de Alajuela Tasa_Resolucion_Pendientes 13.89
CIRCUITO JUDICIAL DE PUNTARENAS (GARABITO) Eficiencia_Carga_Total 12.26
CIRCUITO JUDICIAL DE PUNTARENAS (GARABITO) Tasa_Resolucion_Pendientes 13.66
I Circuito Judicial Zona Atlántica Eficiencia_Carga_Total 12.22
I Circuito Judicial Zona Atlántica Tasa_Resolucion_Pendientes 13.59
II CIRCUITO JUDICIAL DE ALAJUELA (LOS CHILES) Eficiencia_Carga_Total 12.18
II CIRCUITO JUDICIAL DE ALAJUELA (LOS CHILES) Tasa_Resolucion_Pendientes 13.78
CIRCUITO JUDICIAL DE HEREDIA (SAN ISIDRO) Eficiencia_Carga_Total 12.15
CIRCUITO JUDICIAL DE HEREDIA (SAN ISIDRO) Tasa_Resolucion_Pendientes 13.95
III CIRCUITO JUDICIAL DE SAN JOSÉ (ESCAZÚ) Eficiencia_Carga_Total 12.13
III CIRCUITO JUDICIAL DE SAN JOSÉ (ESCAZÚ) Tasa_Resolucion_Pendientes 13.38
II Circuito Judicial de Alajuela Eficiencia_Carga_Total 12.01
II Circuito Judicial de Alajuela Tasa_Resolucion_Pendientes 13.22
II CIRCUITO JUDICIAL DE GUANACASTE (NICOYA) Eficiencia_Carga_Total 11.88
II CIRCUITO JUDICIAL DE GUANACASTE (NICOYA) Tasa_Resolucion_Pendientes 13.16
I Circuito Judicial Zona Sur Eficiencia_Carga_Total 11.72
I Circuito Judicial Zona Sur Tasa_Resolucion_Pendientes 12.89
III CIRCUITO JUDICIAL DE SAN JOSÉ (HATILLO, SAN SEBASTIÁN Y ALAJUELITA) Eficiencia_Carga_Total 11.69
III CIRCUITO JUDICIAL DE SAN JOSÉ (HATILLO, SAN SEBASTIÁN Y ALAJUELITA) Tasa_Resolucion_Pendientes 12.73
III CIRCUITO JUDICIAL DE SAN JOSÉ (ACOSTA) Eficiencia_Carga_Total 11.58
III CIRCUITO JUDICIAL DE SAN JOSÉ (ACOSTA) Tasa_Resolucion_Pendientes 12.47
II CIRCUITO JUDICIAL DE GUANACASTE (SANTA CRUZ) Eficiencia_Carga_Total 11.57
II CIRCUITO JUDICIAL DE GUANACASTE (SANTA CRUZ) Tasa_Resolucion_Pendientes 12.76
I Circuito Judicial de Guanacaste Eficiencia_Carga_Total 11.47
I Circuito Judicial de Guanacaste Tasa_Resolucion_Pendientes 12.64
CIRCUITO JUDICIAL DE PUNTARENAS (MONTES DE ORO, MIRAMAR) Eficiencia_Carga_Total 11.43
CIRCUITO JUDICIAL DE PUNTARENAS (MONTES DE ORO, MIRAMAR) Tasa_Resolucion_Pendientes 12.59
I CIRCUITO JUDICIAL DE GUANACASTE (ABANGARES) Eficiencia_Carga_Total 11.30
I CIRCUITO JUDICIAL DE GUANACASTE (ABANGARES) Tasa_Resolucion_Pendientes 12.49
Circuito Judicial de Puntarenas Eficiencia_Carga_Total 11.28
Circuito Judicial de Puntarenas Tasa_Resolucion_Pendientes 12.43
I Circuito Judicial de Alajuela Eficiencia_Carga_Total 11.24
I Circuito Judicial de Alajuela Tasa_Resolucion_Pendientes 12.36
I CIRCUITO JUDICIAL DE GUANACASTE (LIBERIA) Eficiencia_Carga_Total 11.19
I CIRCUITO JUDICIAL DE GUANACASTE (LIBERIA) Tasa_Resolucion_Pendientes 12.33
I CIRCUITO JUDICIAL DE SAN JOSÉ (TURRUBARES) Eficiencia_Carga_Total 11.15
I CIRCUITO JUDICIAL DE SAN JOSÉ (TURRUBARES) Tasa_Resolucion_Pendientes 12.65
II CIRCUITO JUDICIAL DE LA ZONA SUR (COTO BRUS) Eficiencia_Carga_Total 10.98
II CIRCUITO JUDICIAL DE LA ZONA SUR (COTO BRUS) Tasa_Resolucion_Pendientes 12.32
I CIRCUITO JUDICIAL DE ALAJUELA (SAN MATEO) Eficiencia_Carga_Total 10.96
I CIRCUITO JUDICIAL DE ALAJUELA (SAN MATEO) Tasa_Resolucion_Pendientes 12.21
I Circuito Judicial de Limón Eficiencia_Carga_Total 10.89
I Circuito Judicial de Limón Tasa_Resolucion_Pendientes 11.91
II CIRCUITO JUDICIAL DE LA ZONA SUR (OSA) Eficiencia_Carga_Total 10.83
II CIRCUITO JUDICIAL DE LA ZONA SUR (OSA) Tasa_Resolucion_Pendientes 11.86
CIRCUITO JUDICIAL DE PUNTARENAS (CÓBANO) Eficiencia_Carga_Total 10.67
CIRCUITO JUDICIAL DE PUNTARENAS (CÓBANO) Tasa_Resolucion_Pendientes 11.63
III CIRCUITO JUDICIAL DE SAN JOSÉ (SANTA ANA) Eficiencia_Carga_Total 10.63
III CIRCUITO JUDICIAL DE SAN JOSÉ (SANTA ANA) Tasa_Resolucion_Pendientes 11.73
I CIRCUITO JUDICIAL DE GUANACASTE (LA CRUZ) Eficiencia_Carga_Total 10.55
I CIRCUITO JUDICIAL DE GUANACASTE (LA CRUZ) Tasa_Resolucion_Pendientes 11.60
I CIRCUITO JUDICIAL DE SAN JOSÉ (PURISCAL) Eficiencia_Carga_Total 10.52
I CIRCUITO JUDICIAL DE SAN JOSÉ (PURISCAL) Tasa_Resolucion_Pendientes 11.63
II CIRCUITO DE LA ZONA ATLÁNTICA (SIQUIRRES) Eficiencia_Carga_Total 10.47
II CIRCUITO DE LA ZONA ATLÁNTICA (SIQUIRRES) Tasa_Resolucion_Pendientes 11.39
II CIRCUITO JUDICIAL DE GUANACASTE (CARRILLO) Eficiencia_Carga_Total 10.47
II CIRCUITO JUDICIAL DE GUANACASTE (CARRILLO) Tasa_Resolucion_Pendientes 11.45
I CIRCUITO JUDICIAL DE ALAJUELA (PÓAS) Eficiencia_Carga_Total 10.40
I CIRCUITO JUDICIAL DE ALAJUELA (PÓAS) Tasa_Resolucion_Pendientes 11.24
II CIRCUITO JUDICIAL DE GUANACASTE (HOJANCHA) Eficiencia_Carga_Total 10.36
II CIRCUITO JUDICIAL DE GUANACASTE (HOJANCHA) Tasa_Resolucion_Pendientes 11.39
Circuito Judicial de Cartago Eficiencia_Carga_Total 10.34
Circuito Judicial de Cartago Tasa_Resolucion_Pendientes 11.32
II CIRCUITO JUDICIAL DE LA ZONA SUR (GOLFITO) Eficiencia_Carga_Total 10.31
II CIRCUITO JUDICIAL DE LA ZONA SUR (GOLFITO) Tasa_Resolucion_Pendientes 11.30
CIRCUITO JUDICIAL DE CARTAGO (LA UNIÓN) Eficiencia_Carga_Total 10.26
CIRCUITO JUDICIAL DE CARTAGO (LA UNIÓN) Tasa_Resolucion_Pendientes 11.24
I CIRCUITO DE LA ZONA ATLÁNTICA (BRIBRÍ) Eficiencia_Carga_Total 10.26
I CIRCUITO DE LA ZONA ATLÁNTICA (BRIBRÍ) Tasa_Resolucion_Pendientes 11.15
II CIRCUITO JUDICIAL DE LA ZONA SUR (GOLFITO) (PUERTO JIMÉNEZ) Eficiencia_Carga_Total 10.16
II CIRCUITO JUDICIAL DE LA ZONA SUR (GOLFITO) (PUERTO JIMÉNEZ) Tasa_Resolucion_Pendientes 11.53
CIRCUITO JUDICIAL DE CARTAGO (PARAÍSO) Eficiencia_Carga_Total 9.94
CIRCUITO JUDICIAL DE CARTAGO (PARAÍSO) Tasa_Resolucion_Pendientes 10.92
III CIRCUITO JUDICIAL DE ALAJUELA (SAN RAMON) Eficiencia_Carga_Total 9.91
III CIRCUITO JUDICIAL DE ALAJUELA (SAN RAMON) Tasa_Resolucion_Pendientes 11.00
CIRCUITO JUDICIAL DE HEREDIA (SARAPIQUÍ) Eficiencia_Carga_Total 9.58
CIRCUITO JUDICIAL DE HEREDIA (SARAPIQUÍ) Tasa_Resolucion_Pendientes 10.62
I CIRCUITO JUDICIAL DE LA ZONA SUR (BUENOS AIRES) Eficiencia_Carga_Total 9.56
I CIRCUITO JUDICIAL DE LA ZONA SUR (BUENOS AIRES) Tasa_Resolucion_Pendientes 10.27
I CIRCUITO DE LIMÓN (BRIBRÍ) Eficiencia_Carga_Total 9.49
I CIRCUITO DE LIMÓN (BRIBRÍ) Tasa_Resolucion_Pendientes 10.40
II CIRCUITO JUDICIAL DE LA ZONA SUR (CORREDORES) Eficiencia_Carga_Total 9.13
II CIRCUITO JUDICIAL DE LA ZONA SUR (CORREDORES) Tasa_Resolucion_Pendientes 10.05
CIRCUITO JUDICIAL DE CARTAGO (ALVARADO) Eficiencia_Carga_Total 8.92
CIRCUITO JUDICIAL DE CARTAGO (ALVARADO) Tasa_Resolucion_Pendientes 9.50
III CIRCUITO JUDICIAL DE SAN JOSÉ (PAVAS) Eficiencia_Carga_Total 8.78
III CIRCUITO JUDICIAL DE SAN JOSÉ (PAVAS) Tasa_Resolucion_Pendientes 9.56
II Circuito Judicial de Limón Eficiencia_Carga_Total 8.75
II Circuito Judicial de Limón Tasa_Resolucion_Pendientes 9.59
I CIRCUITO DE LA ZONA ATLÁNTICA (BATÁN-MATINA) Eficiencia_Carga_Total 8.42
I CIRCUITO DE LA ZONA ATLÁNTICA (BATÁN-MATINA) Tasa_Resolucion_Pendientes 9.12
I CIRCUITO JUDICIAL DE GUANACASTE (TILARAN) Eficiencia_Carga_Total 8.16
I CIRCUITO JUDICIAL DE GUANACASTE (TILARAN) Tasa_Resolucion_Pendientes 8.94
I CIRCUITO JUDICIAL DE GUANACASTE (CAÑAS) Eficiencia_Carga_Total 7.62
I CIRCUITO JUDICIAL DE GUANACASTE (CAÑAS) Tasa_Resolucion_Pendientes 8.29
II Circuito Judicial de Guanacaste Eficiencia_Carga_Total 7.05
II Circuito Judicial de Guanacaste Tasa_Resolucion_Pendientes 7.64
III CIRCUITO JUDICIAL DE SAN JOSÉ (ASERRÍ) Eficiencia_Carga_Total 6.57
III CIRCUITO JUDICIAL DE SAN JOSÉ (ASERRÍ) Tasa_Resolucion_Pendientes 6.94
II CIRCUITO DE LIMÓN (SIQUIRRES) Eficiencia_Carga_Total 4.80
II CIRCUITO DE LIMÓN (SIQUIRRES) Tasa_Resolucion_Pendientes 5.29
I CIRCUITO DE LIMÓN (BATÁN-MATINA) Eficiencia_Carga_Total 4.11
I CIRCUITO DE LIMÓN (BATÁN-MATINA) Tasa_Resolucion_Pendientes 4.46

A partir de los datos anteriores creamos el siguiente plot:

Conclusión

A partir de este diagrama de barras podemos ver que el II CIRCUITO JUDICIAL DE SAN JOSE (GOICOECHEA), encabeza y se corona como el circuito mas eficiente a la hora de cerrar casos por violencia domestica.

Pero cual es nuestro top 3 de los mejores así como nuestro top 3 de los peores ?

Circuitos más eficientes:

NombreCircuito Total_Circulante_Inicial Total_Entrados Total_Terminados Carga_Total Eficiencia_Carga_Total Tasa_Resolucion_Pendientes Circulante_Final Reduccion_Pendientes
II CIRCUITO JUDICIAL DE SAN JOSE (GOICOECHEA) 45363 8313 11365 53676 21.17 25.05 42311 6.727950
I CIRCUITO JUDICIAL DE GUANACASTE (BAGACES) 455 54 97 509 19.06 21.32 412 9.450549
CIRCUITO JUDICIAL DE PUNTARENAS (QUEPOS) 3197 421 651 3618 17.99 20.36 2967 7.194245

Circuitos menos eficientes:

NombreCircuito Total_Circulante_Inicial Total_Entrados Total_Terminados Carga_Total Eficiencia_Carga_Total Tasa_Resolucion_Pendientes Circulante_Final Reduccion_Pendientes
I CIRCUITO DE LIMÓN (BATÁN-MATINA) 1143 99 51 1242 4.11 4.46 1191 -4.199475
II CIRCUITO DE LIMÓN (SIQUIRRES) 1191 121 63 1312 4.80 5.29 1249 -4.869857
III CIRCUITO JUDICIAL DE SAN JOSÉ (ASERRÍ) 12168 681 844 12849 6.57 6.94 12005 1.339579

Clustering

Veamos los datos bajo la lupa de un modelo no supervisado (clustering) para entender un poco mas los datos, primero lo queremos ver como un todo utilizando solo las variables nûmericas (no constantes).

Cuantos clusters deberiamos tener?

Según el anterior diagrama deberian ser 2, así que una vez ejecutado nuestro codigo este es el resultado:

Del siguiente gráfico podemos interpretar lo siguiente:

  • Los datos se agrupan naturalmente en dos categorías distintas
  • El cluster 1 (rojo) muestra mayor variabilidad y dispersión en ambas dimensiones
  • El cluster 2 (turquesa) es más homogéneo y compacto
  • La dimensión 1 (eje X) explica aproximadamente el 56.4% de la varianza en los datos
  • La dimensión 2 (eje Y) explica aproximadamente el 21.1% de la varianza

Series Temporales (ARIMA)

Dado a que nuestro Conjunto de datos cuenta con meses y años quisimos utilizar un modelo de forcasting de Series temporales llamado ARIMA (Autoregressive Integrated Moving Average) o Medida Movil Integrada Autorregresiva para intentar predecir como se comportará la violencia domestica en nuestro país.

Una breve explicación de lo que se observa:

Aleatorio (primer gráfico): Representa la variación irregular o residual que queda después de extraer los componentes de tendencia y estacionalidad. Estos son eventos impredecibles que afectan temporalmente los datos pero no forman parte de ningún patrón sistemático. En este caso, se observan fluctuaciones considerables que oscilan entre aproximadamente +2,000 y -2,000.

Estacional (segundo gráfico): Muestra patrones cíclicos que se repiten a intervalos regulares. El patrón estacional es muy marcado y consistente, con picos pronunciados que se repiten aproximadamente cada 10-12 períodos de tiempo, sugiriendo una variación cíclica (posiblemente mensual o trimestral) en los reportes de violencia doméstica.

Observado (tercer gráfico): Muestra los datos originales sin procesar. Se aprecia un incremento significativo en los casos durante los primeros 50 períodos de tiempo, alcanzando un máximo de aproximadamente 50,000 casos alrededor del período 75, seguido de un ligero descenso y estabilización alrededor de 45,000 casos.

Tendencia (cuarto gráfico): Representa el movimiento a largo plazo de la serie. Muestra un claro aumento desde aproximadamente 28,000 hasta 50,000 casos durante los primeros 75 períodos, seguido de una ligera disminución y posterior estabilización con una leve tendencia al alza hacia el final.

Que podemos esperar en nuestro país ?

A notar del anterior gráfico es que a medida que avanza el tiempo, crece la incertidumbre, el intervalo de confianza se ensancha considerablemente.

Conclusión

Nuestro análisis nos mostró que la violencia doméstica en Costa Rica es un problema complejo que tiene patrones claros según el lugar y el tiempo. Encontramos que las zonas del interior del país, especialmente San José, tienen la mayor cantidad de casos. También vimos que hay más denuncias en los primeros meses del año, lo que sugiere que se necesita más ayuda durante ese tiempo. Al estudiar la eficiencia, descubrimos que algunos circuitos judiciales manejan mejor los casos que otros, lo que nos indica que hay oportunidades para mejorar. Nuestras predicciones sugieren que el problema seguirá siendo un desafío importante en el futuro.

Lo que encontramos puede ser útil para:

  • Las personas que toman decisiones en el gobierno
  • Los que trabajan en los tribunales
  • Los que dan servicios de ayuda social

Esto les puede ayudar a:

  • Distribuir mejor los recursos
  • Crear mejores estrategias de prevención
  • Manejar mejor los casos
  • Prepararse para las necesidades futuras

Este proyecto nos permitió aplicar lo aprendido en el curso y ver cómo las herramientas de minería de datos pueden ayudar a entender mejor problemas sociales importantes como la violencia doméstica.